Python網路爬蟲是使用Python語言建立的爬蟲程式,功能上與Web Scraper沒什麼不同,差別就在於Web Scraper會完整執行JavaScript程式碼,而Python爬蟲程式並不會執行JavaScript程式碼。
Web Scraper工具:
使用瀏覽器送出HTTP請求,待伺服器回傳資料後會完整執行JavaScript程式,所以在瀏覽器看到的資料和Web Scraper看到的完全相同。
Python爬蟲程式:
使用函式庫送出HTTP請求,回傳資料只有HTML標籤,並不會包含外部CSS和JavaScript程式碼檔案,所以取回資料和瀏覽器看到的網頁內容可能不同。
今天的分享就先到這邊,我們明天見~
書籍參考資料:文科生也可以輕鬆學習網路爬蟲